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同一 语言 在 不 同 进 制 下 的 正则 性 研究 
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(青岛 远洋 船员 学 院 机 电 系 ， 青 岛 266071) 
摘 要 : 本 文 对 同一 语言 在 不 同 进 制 的 表示 下 正则 性 的 问题 进行 了 研究 ， 证 明了 当 p 与 9 互 质 的 时 候 ， 存 
在 这 样 的 语言 亏 ， 使 得 也 在 p 进 制 表 示 下 是 正则 语言 (字母 表 为 {0, 1,.… ,p 一 1})， 但 是 在 g 表 示 
下 是 非 正则 语言 (字母 表 为 {0, 1,… ,9 一 1})。 而 且 p 与 9 互 质 这 一 条 件 是 必要 的 。 
关键 词 : 正则 语言 ， 进 制 ， 泵 引 理 
分 类 号 : AMS(2000) 68Q45 中 图 分 类 号 : TP301.1 文献 标识 码 : A 


AA ADV) 是 一 种 非常 简单 ， 但 是 又 非常 重要 的 计算 模型 ， 它 所 对 应 的 语言 一 正则 
语言 也 可 以 通过 正则 表达 式 来 定义 ， 正 则 表达 式 是 一 个 非常 强大 的 工具 ， 例 如 正则 表达 
式 [a 一 z0 一 9]+ 可 以 匹配 任意 的 由 字符 或 者 数字 组 成 的 字符 串 。 正 则 表达 式 广 泛 的 应 用 
在 UNIX 命令 中 ， 例 如 grep。 正 则 表达 式 还 可 以 应 用 于 词法 分 析 ， 模 式 匹配 等 领域 。 

在 本 文中 我 们 将 对 正则 语言 的 如 下 数学 性 质 进行 研究 ， 同 一 语言 在 不 同 的 进 制 表示 下 (对 应 
不 同 的 字符 表 )， 其 正则 性 是 否 保持 。 正 则 性 在 很 多 数学 变换 下 都 是 保持 的 ， 例 如 集合 的 交 、 
并 、 补 运算 等 名。 在 本 文中 我 们 将 证 明 ， 在 改变 数 的 进 制 的 时 候 ， 语 言 的 正则 性 并 不 保持 。 

本 文 的 结构 如 下 : 首先 我 们 给 出 一 些 文章 中 需要 的 定义 和 引 理 ， 然 后 我 们 证 明 将 一 个 语言 
由 3 进 制 变 为 2? 进 制 ， 正 则 性 并 不 保持 ， 即 定理 1。 之 后 我 们 将 这 一 结论 推广 到 任意 的 互 质 的 
两 个 进 制 p 和 g (定理 2)。 

定义 1 对 于 一 个 由 自然 数 构成 的 语言 IL， 我 们 用 (Lp 表示 语言 工 在 p 进 制 下 的 表示 ， 即 
将 工 中 的 每 一 个 元 素 都 表示 为 p 进 制 数 ， 相 应 的 字母 表 允 = {0,1, ,p 一 1}。 我 们 把 (L)io 也 
简 记 作 工 。 

例如 由 全 体 偶数 构成 的 语言 BVEN = (EVEN)io = {2,4,6,8,…}， 而 (EVEN)。 = 
{10, 100, 110, 1000,.…. }。 由 全 体 素数 构成 的 语言 PRIME = (PRIME) = {2,3,5,7,11,---}, 
m (PRIM E)z = {10,11,101,111,1011,.:.}。 

引 理 1 设 工 是 一 个 正则 语言 ， 则 存在 常数 n (与 有 关 )， 使 得 对 于 任何 工 中 的 字符 串 w, 
如 果 w 的 长 度 |w| > n， 那 么 包 就 可 以 被 分 成 3 个 子 串 ，w = zyz， 满 足 : 

1) |y| > 0， 即 y 不 是 空 串 ，; 

2) lzyl <n; 

3) 对 所 有 的 上 > 0， 字 符 串 zykz eL 

定理 1 存在 一 个 语言 TL， 它 在 3 进 制 下 的 语言 (L)s 是 正则 语言 ， 但 是 在 2 进 制 下 的 语 
言 (L) 是 非 正则 语言 。 

证 明 ”考虑 语言 卫 = {3"|n > 0}, 工 的 最 初 几 项 分 别 是 : 1, 3,9,27,… 


(L)3 = {1, 10, 100, 1000, - - - h (LDe= {1, 11, 1001, 11011, --- }. 
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我 们 将 证 明 (L) 是 正则 语言 ， 但 (L 不 是 正则 语言 。 

一 个 接受 (L) 的 确定 性 有 穷 自动 机 4: 4 共有 两 个 状态 Q = {go, q1}，go 是 初始 态 ，gi 是 接 
受 态 。j(gqo,1) =q, 6(q1,0) =q- 

下 面 我 们 证 明 (L)s 不 是 正则 语言 。 假 设 (L)s 是 正则 语言 ， 则 存在 着 满足 引 理 1 中 的 常 
Hn. Rm>n, HA3” c L, MER S3” 在 2 进 制 表 示 中 的 位 数 > m+1 > nn (因为 其 在 3 进 
制 表示 中 有 m 十 1 位 )， 所 以 根据 引 理 1，3™ 在 2 进 制 表 示 下 可 以 被 分 成 3 段 ，3™ = (zyz)2， 
满足 引 理 1 的 3 条 性 质 。 设 3 部 分 的 长 度 分 别 是 a, b, c， 由 3m = (eyz) 我 们 有 


3™ = (2)2 :26+° + (9)2 - 2° + (2)2. (1) 


由 引 理 1 中 的 2) 我 们 知道 
a+b=|zry| < n, 


所 以 


ec>m+l—n>2. 


另 一 方面 由 引 理 1 中 的 3) 我 们 知道 对 所 有 的 大 > 0，(zy*z)2 € (ZL)2， 特 别 的 (zyyz)2 € (LL)2， 
因此 存在 正 整 数 s， 使 得 (zyyz)2 = 3*， 所 以 


3° = (27)2 22 十 (0)2 - 2E + (y)a -2° + (2)2. (2) 

(1), (2) 两 式 相 减 得 
3° — 3" = (2)2: (220+° ate) + (yo. 2046 = 2+0] (2)2(2° — 1) + (y)2]. 
显然 s > m， 所 以 3"T|3s 一 3m"， 故 由 上 式 知 
3™ |2°+°[(z)2(2° — 1) + (y)2]. 
因为 gcd (2,3) = 1， 所 以 gcd (2°*°,3") = 1。 因 而 
3” | (x)2(2? — 1) + (y)2- (3) 

由 引 理 1 中 的 1 我们 知道 上 > 0， 因 此 


(x)o(2° — 1) + (y)2 > (a)2 > 0. 


结合 (3) 可 知 
(x)2(2” — 1) + (y)2 > 3”, 
因而 
(z)z -t° + (y)2 :2° + (z)2 > 2°[ (2)2 -2 + (y)2] 2 4-3". (4) 
最 后 一 步 我 们 使 用 了 c > 2 这 一 条 件 。 综 合 (1), (4) 两 式 可 得 3m > 4.3m"， 矛 盾 。 所 以 假设 不 成 
立 ， 即 (5)z 不 是 正则 语言 。 证 毕 


事实 上 ， 定 理 1 可 以 推广 到 任意 满足 gcd(p,g) = 1 的 两 个 进 制 p 和 g。 

定理 2 设 p,q > 1 满足 gcd(p,g) = 1， 则 存在 一 个 语言 L， 它 在 p 进 制 下 的 语言 (L)y 是 正 
则 语言 ， 但 是 在 gq 进 制 下 的 语言 (ZL) 是 非 正则 语言 。 

证 明 考虑 语言 二 = {p"|n > 0}， 易 知 (5)s 是 正则 语言 ， 下 面 证 明 (L) 是 非 正 则 语言 。 
假设 (D)。 是 正则 语言 ， 则 存在 着 满足 引 理 1 中 的 常数 mn。 取 充分 大 的 m > n， 使 得 p™" 在 g 进 制 
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表示 中 的 位 数 > nm。 因为 zm e 工 ， 所 以 根据 引 理 1，zm 在 4 进 制 表 示 下 可 以 被 分 成 3 段 ，pm = 
(zyz)a。 设 3 部 分 的 长 度 分 别 是 a, b, c W 


p™ = (£)q Èt + (y)a q+ (2)¢. (5) 


hFatb=|zsyl <n， 所 以 c> m 十 1 一 n > 2。 另 一 方面 ， 由 引 理 1 (cyyz), € (L) Ae 
在 正 整数 s， 使 得 (zyyz)s = ps， 所 以 


p° = (£)q gte + (ya got + (Y)a 9° + (2): (6) 
(6) 式 减 去 (5) 得 
2 一 gm 一 (zj (g+ — at?) + (y)q- get? = t| (a)l — 1) + Ual. 


显然 s > m， 故 由 上 式 知 
p™ lat(a) — 1) + a]. 


因为 gcd(p,9q) = 1， 所 以 
p™ | (x)q(¢° IS 1) + (y)q: (7) 


因为 b= jy| > 0， 因 此 
(x)q(q’ — 1) + (ya > (a) q > 0. 


故 由 (7) 可 知 
(2)q(q° —1)+(y)q 2 p”, 
因而 
(x)qg- at? + (y)a 9° + (2)a 2 9° [(2)q: 9° + ya] 29-0. (8) 

SEE (5), (8) 两 式 可 得 pm >q p, FE. PTOI, B (L) 不 是 正则 语言 。 证 毕 

定理 2 中 gcd(p,gq) = 1 这 一 条 件 是 必要 的 ， 去 掉 这 一 条 件 后 结论 不 成 立 。 例 如 : p = 2, q= 
4， 可 以 证 明 对 于 一 个 语言 KL， 如 果 (L) EM, WA (La 一 定 是 正则 的 。 

定理 3 设 p,d > 1， 对 于 语言 J， 它 在 p 进 制 下 的 语言 (ZL)p 是 正则 语言 ， 当 且 仅 当 它 
在 p* 进 制 下 的 语言 (ZL)psa 是 正则 语言 。 

引 理 2 设 工 是 字母 表 交 上 的 正则 语言 ， 映 射 h : OST, WS RRT LABS AL) he 
正则 语言 。 

引 理 3 设 工 是 字母 表 T 上 的 正则 语言 ， 映 射 h : E >T, MEERE EES hL) 也 
是 正则 语言 。 

注 RHD EXAH hL) = {wl h(w) € L}e 

引 理 2，3 的 证 明 可 以 在 参考 文献 [2] 中 找到 。 

定理 3 的 证 明 取 


= = {0,1, ,p* — 1}, T = {0,1,--: p—1}4={(0,--- ,0),---,(p—1,--- ,p— VD}. 


MBA A: SST, A(x) = z 在 p 进 制 下 的 表示 。 
假设 语言 二 在 za 进 制 下 的 语言 (Z)ws 是 正则 语言 ， 根 据 引 理 3， 语 言 h((L)ps) 是 正则 语言 ， 

即 语言 (万 ,是 正则 语言 。 反 之 假设 语言 了 在 p 进 制 下 的 语言 (站 )。 是 正则 语言 ， 根 据 引 理 2， 语 

言 ji-1((D)s) 是 正则 语言 ， 即 语言 (站 ve 是 正则 语言 。 证 毕 
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The Regularity of a Language under Different Bases 
SUN Xu-qing, WU Geng-shen 


(Qingdao Ocean Shipping Mariners College, Qingdao 266071) 


Abstract: The change of the regularity of a language under different bases is investigated in this 
paper. We show that for any different bases p and q, if gcd (p,q) = 1, then there exists a language 
L, such that under base p (with alphabet {0,1,--- ,p — 1}) L is a regular language, but under base q 
(with alphabet {0,1,--- ,q—1}) L is not a regular language.” 
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